黄仁勋称赞DeepSeekR1是“AI领域的礼物”
在 5 月 19 号的 2025 台北电脑展(Computex)上,英伟达创始人兼首席执行官黄仁勋(Jensen Huang)发表了主题演讲,全面展示了英伟达的 AI 野心。在谈论到 AI 大模型时,老黄专门提到了 DeepSeek R1,称其是“给 AI 领
礼物 英伟达 rtx 黄仁勋 deepseekr1 2025-05-19 17:46 10
在 5 月 19 号的 2025 台北电脑展(Computex)上,英伟达创始人兼首席执行官黄仁勋(Jensen Huang)发表了主题演讲,全面展示了英伟达的 AI 野心。在谈论到 AI 大模型时,老黄专门提到了 DeepSeek R1,称其是“给 AI 领
礼物 英伟达 rtx 黄仁勋 deepseekr1 2025-05-19 17:46 10
面向个人有DGX Station,在桌面跑1T参数大模型,这回刀法也不用了,足足给到800GB内存。
英伟达 内存 deepseek deepseekr1 桌面超 2025-05-19 15:58 10
在 5 月 19 号的 2025 台北电脑展(Computex)上,英伟达创始人兼首席执行官黄仁勋(Jensen Huang)发表了主题演讲,全面展示了英伟达的 AI 野心。在谈论到 AI 大模型时,老黄专门提到了 DeepSeek R1,称其是“给 AI 领
礼物 鸿海 黄仁勋 deepseek deepseekr1 2025-05-19 15:02 8
尤其是代码能力,LiveCodeBench 和 Codeforces 两个榜单,高于所有其它模型,包括当前最强的 Gemini2.5-Pro。
deepseek mcp deepseekr1 qwen3 2025-05-16 18:09 11
基于我们一直使用的AMD EPYC Rome基准系统获得了稳定性能表现 这套初始配置依然出色!设备拥有者现在可以在Q4 671b完整模型上获得4.25-3.5 TPS(每秒令牌数)。完整版16K以上上下文窗口的模型体验远胜精简版,值得投入。纯CPU运行时可同时
翻译 deepseekr1 运行deepseek deeps 2025-02-15 18:50 12
另外,我对机构服务收费,但不面向个人。而且我会在与机构沟通交流的基础上,形成最终版本免费发表。我认为这是一种信息平权,既符合互联网精神,也符合社会主义精神。
模型 gdp deepseek 华尔街 deepseekr1 2025-04-12 19:33 12
基于规则的强化学习(RL/RFT)已成为替代 SFT 的高效方案,仅需少量样本即可提升模型在特定任务中的表现。
开源 vivo gui rft deepseekr1 2025-04-09 13:50 14
关键的转折发生在1月25日,美国知名科技投资人马克·安德森(Marc Andreessen)在连续三篇深度评测中,将其定义为"后Transformer时代的范式转移",这一评价被《华尔街日报》转化为"AI领域的斯普特尼克时刻"的标题。
芯片 deepseek 战争 r1 deepseekr1 2025-04-06 10:42 11
Zabbix作为成熟的监控系统,存储了大量基础设施的实时数据。通过Dify与Zabbix集成,可直接用自然语言查询监控指标(如CPU使用率、磁盘空间)并生成动态图表。本文重点从实现思路和方式上进行探索,一些细节性的处理未经验证,有兴趣的小伙伴可以结合思路进行尝
模型 zabbix json dify deepseekr1 2025-03-22 22:37 9
在介绍V3时,我们介绍了各式各样的提示词技巧,但在R1中,需要有种“返璞归真”的魄力,忘掉所有的提示词技巧,直接告诉AI你想干什么事儿、想要什么结果,就够了。
模型 deepseek r1 deepseekr1 倒像 2025-04-04 07:09 12
定性讨论答案框选当前强化学习优化技术依赖从明确的最终答案中提取奖励,为此模型常被要求将最终答案放在 \boxed {} 环境中。然而,这在 USAMO 问题解答中产生了意外副作用:即使大多数评估问题不需要框选答案,模型仍习惯性地这样做。一个典型例子是问题 5
模型 奥数 deepseekr1 deepsee r1平均分 2025-04-03 17:14 11
在正式介绍DeepSeekR1之前,需要解释一下指令型模型和推理型模型的区别。R1之前的AI模型,如GPT-4、Kimi(最新的1.5也属于推理型模型)、豆包等,都属于指令型模型。
模型 推理 deepseek r1 deepseekr1 2025-04-03 07:22 12
很多针对大型语言模型(LLMs)的数学基准测试已经表明,最先进的推理模型在美国数学邀请赛(AIME)等数学竞赛中表现出色,O3-MINI 模型甚至达到了与顶尖人类参赛者相当的水平。然而,这些测试仅仅评估了最终答案,而忽略了推理和证明过程。
模型 奥数 deepseekr1 deepsee r1平均分 2025-04-02 18:53 12
智谱在 2025 中关村论坛上发布最新 agent 产品:AutoGLM 沉思。作为首个集深度研究能力和操作能力于一体的 Agent,AutoGLM 沉思能一边进行复杂思考,一边执行操作。像人类一样打开并浏览网页,完成从数据检索、分析到生成报告。
秒杀 deepseekr1 glm 秒杀deepseekr1 2025-03-31 14:54 13
例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。
模型 游戏 deepseek 棋牌 deepseekr1 2025-03-29 13:25 14
在人工智能与元宇宙浪潮交汇之际,中国壹点科技集团旗下深圳壹点科技投资有限公司(简称:壹点科技)今日震撼发布天鸽数字人(Hatoai)升级版,首次将自主研发的无人直播带货功能与国产顶尖大模型DeepSeek R1深度融合,打造出一站式、智能化的虚拟营销解决方案。
震撼 deepseek 天鸽 deepseekr1 天鸽数字 2025-03-29 06:04 14
据 Google 周二在博客文章中表示,Gemini 2.5 是一个新的 AI 推理模型,旨在与 DeepSeek R1 展开竞争,目前在 LMArena 整体评分中排名最高。
gemini google deepseekr1 deeps 2025-03-27 17:21 14
而操作系统方面,由于绝大多数工业场景下微调会涉及多卡微调,目前只有Linux系统对DeepSpeed和其他多卡并行加速库支持较好,因此绝大多数工业场景下都会使用Ubuntu操作系统或 CentOS操作系统。本次以Ubuntu系统为例来进行高效微调,CentOS
模型 下载 医疗 deepseek deepseekr1 2025-02-17 08:13 16
2024年,Scaling Law逐步见顶,业界普遍认为通用LLM走到“高原区”,进化乏力,除了多模态LLM还在日新月异。行业灯塔OpenAI也迟迟不发布GPT-5, 哪怕是GPT-4.5。
推理 llms deepseekr1 deep 推理llms 2025-03-26 21:53 13
近日召开的杨浦区科技创新大会上,以共筑“杨数浦”新质秀带为主题,杨浦密集发布了一系列企业创新项目。其中,道客d.run上线DeepSeek R1模型引人注目。
开源 deepseek infra deepseekr1 推 2025-03-22 23:00 16